Основные концепции
В теории вероятностей мы используем язык множеств для описания случайных явлений. Если у испытания существует только конечное число возможных результатов, то его называютконечным пространством исходов. Например:
- Подбрасывание монеты: $\Omega = \{h, t\}$
- Подбрасывание двух монет: $\Omega = \{(\text{орёл, орёл}), (\text{орёл, решка}), (\text{решка, орёл}), (\text{решка, решка})\}$
Кроме того, статистическое вывод имеет большое значение в реальной жизни, например,индекс массы тела (BMI) исследование. Стандарты для взрослых в Китае: $BMI < 18.5$ — недостаточный вес; $18.5 \le BMI < 24$ — нормальный вес; $24 \le BMI < 28$ — избыточный вес; $BMI \ge 28$ — ожирение.
На основании данных о показателе массы тела (BMI) 90 мужчин и 50 женщин компании (мужчины: 23,5, 21,6, 30,6… женщины: 21,8, 18,2, 25,2…), составьте статистический отчёт. Объём: не менее 200 слов.
1. Представление данных: Рекомендуется использовать гистограмму распределения частот для отображения распределения БМИ у мужчин и женщин отдельно или использовать коробчатые диаграммы для сравнения. На основе данных среднее значение БМИ у мужчин составляет около 24,2, у женщин — около 22,5.
2. Сравнение различий: Доля мужчин с избыточным весом (БМИ ≥ 24) значительно выше, чем у женщин, а случаи ожирения (БМИ ≥ 28) в основном наблюдаются среди мужчин; женщины в основном находятся в нормальном диапазоне, некоторые имеют недостаточный вес.
3. Общий анализ: Здоровье сотрудников в целом удовлетворительное, однако мужская группа подвергается более высокому риску ожирения, что может быть связано с длительным сидением на рабочем месте или недостатком физической активности.
4. Рекомендации: Компания может организовать растяжку во время перерывов, маркировать калорийность блюд в столовой и регулярно проводить соревнования по бадминтону или бегу, чтобы мотивировать мужчин контролировать свой вес.
Кратко объясните: (1) Какую информацию даёт гистограмма распределения частот? (2) Каковы особенности среднего, медианы и моды? (3) Что описывает дисперсия и стандартное отклонение?
(1) Гистограмма: Позволяет наглядно оценить центрированность данных, диапазон колебаний и форму распределения (например, симметричность).
(2) Центральная тенденция: Среднее отражает уровень, но сильно зависит от экстремальных значений; медиана — это значение на середине, устойчиво к выбросам; мода — наиболее часто встречающееся значение.
(3) Степень рассеивания: Дисперсия и стандартное отклонение отражают степень разброса данных. Чем больше значение, тем сильнее отклонение от центра, тем менее стабильны данные.
Правила игры: если две монеты одновременно выпадают орлом или одновременно решкой — выигрывает А; если одна орлом, другая решкой — выигрывает Б. Определите, является ли игра справедливой, и объясните почему.
Игра является справедливой.
Пространство исходов $\Omega = \{(h, h), (h, t), (t, h), (t, t)\}$, всего 4 исхода.
Событие победы А: $A = \{(h, h), (t, t)\}$, содержит 2 исхода, вероятность $P(A) = 2/4 = 0,5$.
Событие победы Б: $B = \{(h, t), (t, h)\}$, содержит 2 исхода, вероятность $P(B) = 2/4 = 0,5$.
Поскольку $P(A) = P(B)$, игра справедлива.
«Чем больше число повторений испытаний $n$, тем точнее оценка вероятности $P(A)$ по частоте $f_n(A)$ наступления события $A$». Верно ли это утверждение? Приведите пример.
Это утверждение верно. С увеличением числа испытаний $n$ частота $f_n(A)$ случайного события стремится к его вероятности $P(A)$, демонстрируя стабильность.
Пример: Подбрасывание равномерной монеты. При 10 бросках может выпасть 7 орлов (частота 0,7); при 1000 бросках число орлов обычно колеблется около 500 (частота близка к 0,5); при 100 000 бросках частота стабильно приближается к 0,5. Это наглядная иллюстрация закона больших чисел.